csv、xlsx、pickle 檔案讀寫
CSV(Comma-Separated Values,又叫逗號分隔值)檔案的格式不存在通用標準,也沒有指定所使用的字元編碼,廣泛應用在程式之間轉移表格資料
import pandas as pd # 載入pandas套件,縮寫為pd
df = pd.read_csv('資料路徑')
print(df)
df.dropna() # 刪除包含NaN的行
df.T # 將 df 內容轉置
df.to_csv('new_df.csv') # 將 Pandas DataFrame 儲存為 CSV 檔
利用pd.read_cvs()
讀入.csv檔,列印讀入內容,並利用df.dropna()
刪除包含空值得行,並將 Pandas DataFrame 存為 csv
檢查是否已有 openpyxl 套件
pip show openpyxl # 檢查是否已安裝 openpyxl 套件
安裝 openpyxl 套件
pip install openpyxl # 安裝 openpyxl 套件
openpyxl 使用
workbook = openpyxl.load_workbook('資料路徑') # 載入 excel 文件
worksheet = ['工作表名稱'] # 選擇指定工作表
row7 = [cell.value for cell in worksheet[7]] # 將第7行資料存到row7
cell_811 = worksheet.cell(row=8, column=11).value # 將第8行第11欄的資料存到cell_811
print(row7)
print(cell_811)
open('test.pkl', 'wb')
'test.pkl'是欲打開的文件名稱,'wb'是欲打開的文件模式(w:表示寫模式,b:表示二禁制模式)
pickle.dump(data, file)
將模組中的一個函數用序列化後的數據寫入到文件中,data是要序列的對象,file是以2進制寫模式打開的文件對象,序列化的數據將寫到這個文件中
Pickle.load(file)
從文件file中讀取序列化的數據,並將其反序列化為原始的Python對象
import pickle
data = {'Name': 'Josh', 'age': 20, 'is_student': True} # 要序列化的字典
# 序列化字典並寫入 pickle 文件
with open('test.pkl', 'wb') as file:
pickle.dump(data, file)
# 從 pickle 文件讀取字典
with open('test.pkl', 'rb') as file:
ex = pickle.load(file)
# 修改讀取後的數據
ex['age'] = 23
ex['is_student'] = False
print(ex)